Más allá de la alineación entre modalidades: Midiendo y aprovechando la brecha de modalidad en modelos de visión-lenguaje
Aprende a medir y aprovechar la brecha de modalidad en modelos de visión-lenguaje. Mejora la alineación entre imagen y texto con estrategias clave.